峰度 (Kurtosis) – 快速入门

作者:Ruben Geert van den Berg,归类于 统计 A-Z

  • 峰度示例 (Kurtosis Examples)
  • 峰度公式 (Kurtosis Formulas)
  • 峰度还是超额峰度?(Kurtosis or Excess Kurtosis?)
  • 峰度计算示例 (Kurtosis Calculation Example)
  • 扁平峰 (Platykurtic), 中峰 (Mesokurtic) 和尖峰 (Leptokurtic)

在统计学中,峰度 (Kurtosis) 指的是定量变量分布的“尖峰程度”。理解“尖峰程度”的最佳方式是查看下面的示例直方图。

峰度示例 (Kurtosis Examples)

峰度直方图示例

测验 4 几乎完美地呈正态分布。因此,其超额峰度 (Excess Kurtosis) 接近于 0。

测验 3 的分布比正态曲线“更平坦”:直方图的条形低于曲线的中间部分,而高于曲线的尾部。因此,测验 3 具有超额峰度。

测验 5 比正态曲线“更尖”:其条形高于曲线的峰值,而低于曲线的尾部。因此,测验 5 具有超额峰度。

测验 2 大致遵循均匀分布。因为它比测验 3 更平坦,所以它具有更强的负超额峰度。

测验 1 具有最强的负超额峰度,它具有双峰分布 (bimodal distribution)。

对于具有强 (正) 偏度 (skewness) 的变量,例如测验 6,通常会看到正超额峰度。

现在我们已经了解了(超额)峰度的含义,让我们看看如何计算它。

峰度公式 (Kurtosis Formulas)

如果您的数据包含整个总体,而不仅仅是一个样本,则总体峰度 \(K_p\) 计算如下:

\[K_p = \frac{M_4}{M_2^2}\]

其中 \(M_2\) 和 \(M_4\) 表示围绕均值的二阶矩和四阶矩:

\[M_2 = \frac{\sum\limits_{i = 1}^N(X_i - \overline{X})^2}{N}\]

\[M_4 = \frac{\sum\limits_{i = 1}^N(X_i - \overline{X})^4}{N}\]

请注意,\(M_2\) 只是总体方差公式。

峰度还是超额峰度?(Kurtosis or Excess Kurtosis?)

一个正态分布 (normally distributed) 的变量的峰度为 3.0。由于这是不期望的,因此总体超额峰度 \(EK_p\) 定义为

\[EK_p = K_p - 3\]

因此,对于正态分布的变量,**_超额_峰度为 0.0**。

现在,一切都很好。但是,_不好_的是,“峰度”在标准教科书和软件包中既指峰度又指超额峰度,而没有明确说明报告的是哪一个。

总之。

到目前为止,我们的公式仅适用于包含整个总体的数据。如果您的数据仅包含来自某个总体的样本 - 通常情况如此 - 那么您将需要计算样本超额峰度 \(EK_s\) 如下:

\[EK_s = ((N + 1) \cdot EK_p + 6) \cdot \frac{(N - 1)}{(N - 2) \cdot (N - 3)}\]

此公式得到的结果是大多数软件包(例如 SPSS, Excel 和 Googlesheets)报告的“峰度”。最后,大多数教科书建议(超额)峰度的标准误差 \(SE_{eks}\) 计算如下:

\[SE_{eks} \approx \sqrt{\frac{24}{N}}\]

但是,对于小样本量,此近似值并不准确。因此,软件包使用更复杂的公式。我不会用它来烦你。

峰度计算示例 (Kurtosis Calculation Example)

此 Googlesheet (只读) 中显示了超额峰度的示例计算,部分内容如下所示。

峰度计算示例 Googlesheets 数据

我们计算了分数 1 到 10 的超额峰度。首先,我们添加了它们的平均值,M = 5.50。接下来,

\(D\) 表示差值 (分数 - 平均值); \(D^2\) 是用于计算方差的平方差; \(D^4\) 是差值的四次方。

如下所示,剩下的计算也很简单。

峰度计算示例 Googlesheets 公式

请注意,超额峰度 = 1.20。SPSS 输出如下所示,确认了此结果。

SPSS 输出表中的峰度

扁平峰 (Platykurtic), 中峰 (Mesokurtic) 和尖峰 (Leptokurtic)

一些与超额峰度相关的术语:

  • 超额峰度 < 0 的变量称为扁平峰 (platykurtic)
  • 超额峰度 = 0 的变量称为中峰 (mesokurtic)
  • 超额峰度 > 0 的变量称为尖峰 (leptokurtic)

我们的 峰度示例 (kurtosis examples) 说明了扁平峰 (platykurtic),中峰 (mesokurtic) 和尖峰 (leptokurtic) 分布的典型外观。

在 Excel 和 SPSS 中查找峰度 (Finding Kurtosis in Excel & SPSS)

首先,“峰度”始终指的是 Excel,Googlesheets 和 SPSS 中的样本超额峰度。在 Excel 和 Googlesheets 中,可以通过使用类似 =KURT(A2:A11) 的公式找到它。

SPSS 有许多计算超额峰度的选项,但我个人更喜欢使用 A nalyze (分析) SPSS 菜单箭头 C ompare Means (比较均值) SPSS 菜单箭头 M eans (均值)。

如下所示,可以从 Options (选项) 中选择峰度,并将其拖动到所需位置。

在 SPSS 中查找峰度